\chapter{统计学发展历史}
\author{李国斌}
\date{2025年09月06日}

\section{统计学事件}

\subsection{先驱者的探索：卡尔达诺与《论赌博游戏》} 

在帕斯卡与费马的一个世纪之前，意大利博学者吉罗拉莫·卡尔达诺（Girolamo Cardano, 1501-1576）——身兼数学家、医生、赌徒多重身份——便已在其著作《论赌博游戏》（\textit{Liber de Ludo Aleae}，约1564年完成，1663年出版）中，首次系统性地尝试用数学方法分析赌博问题。

卡尔达诺清晰地阐述了\textbf{“等可能事件”}的概念，并正确地计算了掷骰子等游戏中某些结果的概率。例如，他明确指出掷出一个六点的概率是$1/6$，而掷出双六点的概率是$1/36$。他甚至触及了\textbf{数学期望}的初步思想。

然而，卡尔达诺的工作存在局限性：其研究零散且缺乏一般化的数学体系，更未能引发广泛的学术关注。他的著作在他去世后才得以出版，仿佛一颗被埋没的种子，未能立即孕育出参天大树。但其历史地位不容忽视，它标志着人类首次明确地将“机会”纳入数学分析的范畴，为后来的革命性突破提供了思想上的先驱。

\subsection{核心驱动力：梅雷骑士与他的赌博问题} % <- 小节名称可稍作优化
尽管有卡尔达诺这样的先驱，但概率论作为一门数学学科的正式诞生，普遍公认的标志性事件发生在1654年。其最直接的催化剂是一位法国贵族——\textbf{安托万·戈姆博德，切瓦利尔·德·梅雷}（Antoine Gombaud, Chevalier de Méré, 1607–1684）。

梅雷骑士是法国17世纪的一位贵族、作家、哲学家，同时也是一位著名的赌徒。他之所以在数学史上留名，并非因为他在文学或哲学上的成就，而是因为他向科学家提出的两个概率论难题。他敏锐的观察和困惑直接推动了布莱兹·帕斯卡和皮埃尔·德·费马在1654年的一系列通信。

这两个著名的问题是：
\begin{enumerate}
	\item \textbf{点数问题（Problem of Points）}：一场中断的赌博如何公平地分配赌注？该问题催生了“数学期望”的核心概念。
	\item \textbf{掷骰子问题（“梅雷悖论”）}：为何押“单骰4次出现6点”有利可图，而押“双骰24次出现双6点”却会输钱？这个问题揭示了概率的非线性本质，即 $1 - (5/6)^4 \approx 0.5177 > 0.5$ 而 $1 - (35/36)^{24} \approx 0.4914 < 0.5$。
\end{enumerate}

帕斯卡与费马在通信中解决了这些问题，他们的工作普遍被认为是\textbf{概率论作为数学学科诞生的标志}。因此，梅雷骑士作为一个“提问者”，以其来自赌博实践的关键问题，意外地催生了一个伟大的数学分支。

\subsection{知识的系统化与传播：惠更斯的《论赌博中的计算》}
帕斯卡与费马的通信虽然奠定了基础，但仍是私人间的思想交流。将概率论首次带入公共视野并加以系统化的，是荷兰物理学家、天文学家、数学家克里斯蒂安·惠更斯（Christiaan Huygens, 1629-1695）。

1657年，惠更斯在访问巴黎期间了解到帕斯卡与费马关于概率问题的研究，深受启发。同年，他用自己的方法重新论证和扩展了这些思想，并用拉丁文写成了《论赌博中的计算》（\textit{De Ratiociniis in Ludo Aleae}）一文。这篇论文通常被认为是概率论史上的\textbf{第一部正式著作}。

惠更斯的著作不仅清晰地阐述了“期望值”（Expectation）这一核心概念，还以此为基础，系统地解决了14个概率问题。他的工作将零散的讨论整合成了一个更易于理解和传播的初步框架。

在此后的半个多世纪里，惠更斯的这篇论文成为了概率论的标准教材和进一步研究的起点。因此，惠更斯在概率论从“天才的灵光一现”转变为“一门可被学习和发展的数学分支”的过程中，扮演了不可或缺的\textbf{系统化者和传播者}的角色。

\subsection{社会的量化：统计学的萌芽} % <- 新增小节
17世纪“计算理性化”的浪潮并不仅限于赌桌和数学家的书房，它同样席卷了对社会本身的认知。在英国，一种试图用数字来理解社会规律的思想开始兴起，其开创者是约翰·格朗特（John Graunt, 1620--1674）。

1662年，格朗特出版了《关于死亡公报的自然与政治观察》（\textit{Natural and Political Observations Mentioned in a Following Index, and Made upon the Bills of Mortality}）一书。他系统性地分析了伦敦几十年的死亡记录，并做出了开创性的工作：
\begin{itemize}
	\item 他发现了许多人口现象中隐藏的\textbf{规律性和稳定性}，例如出生性别比大致恒定。
	\item 他编制了世界上第一张\textbf{生命表}，显示了人口群体的死亡规律，这为现代人寿保险奠定了基石。
	\item 他的工作证明了大量社会现象虽就个体而言是偶然的，但就整体而言却呈现出惊人的统计规律。因此，他被誉为\textbf{人口统计学}的奠基人。
\end{itemize}

格朗特的朋友威廉·配第（William Petty, 1623--1687）继承并推广了这种思想。他在《政治算术》（\textit{Political Arithmetic}, 1676年）一书中极力主张，研究社会和经济问题不应依赖于抽象的推理或感性的争论，而应依赖于基于数据的“数字、重量和尺度”（Number, Weight, and Measure）。配第由此成为\textbf{经济学统计学派}的先驱。

格朗特和配第的工作，与同时代帕斯卡等人的概率研究形成了强大的合力：一个提供了从数据中\textbf{发现}规律的方法（统计学），另一个则提供了\textbf{解释和理解}这些规律背后的数学原理（概率论）。两者共同构成了用理性计算把握不确定世界的两大支柱，标志着“计算理性化”范式在社会领域的成功应用。

\subsection{理论的深化：伯努利与大数定律}
概率论的基础被帕斯卡、费马和惠更斯奠定后，其发展并未停止。下一个飞跃来自瑞士数学家雅各布·伯努利（Jacob Bernoulli, 1654--1705）。在其遗作《猜度术》（\textit{Ars Conjectandi}, 1713年出版）中，他完成了概率论从“计算术”到“推断理论”的升华。

伯努利最重要的贡献是提出了\textbf{大数定律}（Law of Large Numbers）。该定律以严格的数学形式证明：尽管单次随机试验的结果无法预测，但随着试验次数的无限增加，事件的\textbf{发生频率}将会无限接近于其内在的\textbf{理论概率}。

这一定律具有划时代的意义：
\begin{itemize}
	\item 它首次在“偶然性”与“必然性”之间架起了一座数学的桥梁，为概率论的哲学合理性提供了坚实支撑。
	\item 它奠定了\textbf{统计学}的理论基础，为通过观察有限的样本数据来推断总体未知参数提供了最初且最根本的理论依据。
	\item 它将概率论的应用范围从赌博游戏极大地扩展至保险、人口统计、天文观测等几乎所有需要处理不确定数据的科学领域。
\end{itemize}

伯努利的工作标志着概率论已不再仅仅是关于“赌博的计算”，而是成为了一种理解和探索世界的强大\textbf{归纳推理}工具。


\subsection{理论的扩展：棣莫弗、贝叶斯与新的疆界} 
进入18世纪，概率论在伯努利的基础上继续向纵深发展，其中两位关键人物是亚伯拉罕·棣莫弗（Abraham de Moivre, 1667--1754）和托马斯·贝叶斯（Thomas Bayes, 1701--1761）。

棣莫弗在其著作《机会论》（\textit{The Doctrine of Chances}, 1718, 1738, 1756）中取得了多项重大突破：
\begin{itemize}
	\item 他首次推导出了\textbf{正态分布}（Normal Distribution）的概率密度函数表达式，当时被称为“钟形曲线”，用以作为二项分布的近似。
	\item 在此基础上，他证明了一个关键定理：当试验次数无限增加时，二项分布逼近于正态分布。这一定理被视为\textbf{中心极限定理}（Central Limit Theorem）的最早形式。
	\item 中心极限定理揭示了众多微小、独立的随机因素叠加后所产生的宏观效应服从正态分布，这为误差分析、社会现象研究提供了极其强大的理论工具。
\end{itemize}

与此同时，托马斯·贝叶斯则在思考一个完全不同的问题：如何根据观察到的结果来推断产生该结果的原因的概率？在他去世后于1763年发表的论文《论机会学说中一个问题的解》中，他提出了\textbf{贝叶斯定理}的雏形。该定理提供了在已知先验知识的前提下，根据新证据更新概率信念的数学框架。

贝叶斯的工作开创了概率论的\textbf{另一条解释路径}：概率不仅可以表示长期频率，还可以表示对某个命题的\textbf{主观置信度}。这为后来的贝叶斯统计学奠定了基础，使其在机器学习、人工智能等领域发挥着至关重要的作用。

棣莫弗和贝叶斯的工作表明，到18世纪中叶，概率论已从一个解决赌博问题的工具，发展成为一门拥有丰富理论内涵和多元化哲学基础的成熟数学分支，为其在科学各领域的广泛应用做好了准备。

\subsection{棣莫弗-拉普拉斯定理的推导}
\begin{tcolorbox}[title=数学注记：棣莫弗-拉普拉斯定理的推导, colback=blue!5!white, colframe=blue!75!black]
	棣莫弗-拉普拉斯定理作为中心极限定理的特例，可以从更广泛的数学框架中导出。一种优美的方式是通过\textbf{欧拉-麦克劳林公式}（Euler–Maclaurin formula）。
	
	该公式建立了积分与和分之间的精确联系：
	\[
	\sum_{k=a}^{b} f(k) = \int_{a}^{b} f(x) \, dx + \frac{f(a) + f(b)}{2} + \sum_{k=1}^{\lfloor m/2 \rfloor} \frac{B_{2k}}{(2k)!} \left( f^{(2k-1)}(b) - f^{(2k-1)}(a) \right) + R_m
	\]
	其中 $B_{2k}$ 是伯努利数。
	
	通过对二项分布 $B(n, p)$ 的概率质量函数 $P(S_n = k) = \binom{n}{k} p^k (1-p)^{n-k}$ 应用斯特林公式和欧拉-麦克劳林公式，并考察其在 $k = np + x\sqrt{np(1-p)}$ 处的渐近行为，可以严格推导出正态分布的密度函数：
	\[
	P(S_n = k) \sim \frac{1}{\sqrt{2\pi np(1-p)}} e^{-\frac{x^2}{2}} \quad \text{当} \quad n \to \infty
	\]
	这一推导揭示了中心极限定理的本质：大量独立随机变量的和分行为由其积分（正态分布）所主导。
\end{tcolorbox}

\subsection{贝叶斯定理与贝塔函数}

\begin{tcolorbox}[title=数学注记：贝叶斯定理与贝塔函数, colback=green!5!white, colframe=green!75!black]
	贝叶斯定理在共轭先验的情形下，与特殊函数存在深刻的联系。对于二项分布的参数估计，其共轭先验是\textbf{贝塔分布}（Beta distribution）。
	
	贝塔分布的概率密度函数由贝塔函数定义：
	\[
	\operatorname{Beta}(p \mid \alpha, \beta) = \frac{1}{B(\alpha, \beta)} p^{\alpha-1} (1-p)^{\beta-1}
	\]
	其中 $B(\alpha, \beta)$ 是贝塔函数，与伽马函数的关系为 $B(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}$。
	
	假设先验分布 $P(H) \sim \operatorname{Beta}(\alpha, \beta)$，似然函数为二项分布 $P(E \mid H) \sim \operatorname{Bin}(n, k)$，则根据贝叶斯定理，后验分布正比于：
	\[
	P(H \mid E) \propto P(H) \cdot P(E \mid H) \propto p^{\alpha-1}(1-p)^{\beta-1} \cdot p^k (1-p)^{n-k} = p^{\alpha+k-1}(1-p)^{\beta+n-k-1}
	\]
	这正是 $\operatorname{Beta}(\alpha + k, \beta + n - k)$ 分布的核心。因此，贝叶斯更新过程在数学上等价于贝塔函数参数的简单叠加：
	\[
	B(\alpha, \beta) \rightarrow B(\alpha + k, \beta + n - k)
	\]
	这一优美结果显示了贝叶斯推断如何将主观信念（先验参数）与客观数据（观测计数）通过贝塔函数完美地融合在一起。
\end{tcolorbox}

% ================================
% 第三章：数学结构的深层统一性
% ================================
\section{数学结构的深层统一性：从贝塔函数到量子世界}
前述概率论与统计学的发展，其内在动力远不止于解决实际问题的需求，更源于数学宇宙本身所具有的深刻而统一的优美结构。贝塔函数（Beta function）与伽马函数（Gamma function）作为这一结构的核心枢纽，将概率论、数论、分析学乃至物理学紧密地联系在一起。

\subsection{特殊函数：数学的通用语言}
伽马函数 $\Gamma(s)$ 作为阶乘的解析延拓，其定义式为：
\[
\Gamma(s) = \int_0^\infty x^{s-1} e^{-x}  dx, \quad \Re(s) > 0
\]
贝塔函数与伽马函数的关系由以下恒等式给出：
\[
B(x, y) = \frac{\Gamma(x) \cdot \Gamma(y)}{\Gamma(x + y)} = \int_0^1 t^{x-1} (1-t)^{y-1}  dt
\]
这一看似简单的公式，却蕴含着非凡的“融合”与“分解”的对称性思想。

\subsection{枢纽作用：连接各数学分支}
贝塔与伽马函数深刻反映了以下紧密联系：
\begin{itemize}
	\item \textbf{周期性}：伽马函数本身虽非周期，但其倒数 $1/\Gamma(s)$ 是整函数，且与正弦函数的关系 $\Gamma(s)\Gamma(1-s) = \pi / \sin(\pi s)$ 揭示了其与经典周期函数的深刻渊源。
	\item \textbf{模形式}：模形式是复上半平面上的全纯函数，具有极高的对称性。许多模形式的L-函数及其积分表示都与伽马函数密切相关，后者提供了其函数方程中的“γ因子”。
	\item \textbf{对数变换与积分表示}：贝塔函数的积分定义式是最基本的欧拉积分。通过对该积分核取对数变换或进行梅林变换，可以自然地导出其与其它特殊函数的关系。
	\item \textbf{傅里叶变换}：高斯函数 $e^{-x^2}$ 的傅里叶变换仍是高斯函数，而伽马函数可以视为幂函数的一种“乘法特征标”，在调和分析中地位核心。正态分布（高斯分布）的广泛性，在深层意义上源于此。
\end{itemize}

\begin{figure}[h]
	\centering
	\begin{tikzpicture}[
		concept/.style={ellipse, draw, thick, align=center, minimum height=1.2cm, text width=2.5cm},
		arrow/.style={-Stealth, thick, shorten >=2pt, shorten <=2pt}
		]
		% Nodes
		\node[concept, fill=red!20] (beta) {贝塔函数 \\ $B(x, y)$};
		\node[concept, fill=blue!20, above right=1.5cm and 2cm of beta] (gamma) {伽马函数 \\ $\Gamma(s)$};
		\node[concept, fill=green!20, below right=1.5cm and 2cm of beta] (stats) {概率论与\\统计学};
		\node[concept, fill=orange!20, above=of gamma] (nt) {数论\\模形式};
		\node[concept, fill=purple!20, right=of gamma] (fa) {傅里叶分析\\调和分析};
		\node[concept, fill=cyan!20, right=of stats] (qm) {量子力学\\路径积分};
		
		% Edges
		\draw[arrow] (beta) -- node[midway, sloped, above] {定义} (gamma);
		\draw[arrow] (gamma) -- node[midway, sloped, above] {应用} (nt);
		\draw[arrow] (gamma) -- node[midway, above] {核心工具} (fa);
		\draw[arrow] (beta) -- node[midway, sloped, above] {共轭先验} (stats);
		\draw[arrow] (stats) -- node[midway, sloped, above] {正态分布} (fa);
		\draw[arrow] (stats) -- node[midway, sloped, above] {量子统计} (qm);
		\draw[arrow] (fa) -- node[midway, sloped, above] {算符谱分析} (qm);
		\draw[arrow, dashed] (gamma) to [bend right=15] node[midway, sloped, below] {函数方程} (nt);
		\draw[arrow, dashed] (gamma) to [bend left=15] node[midway, sloped, above] {积分变换} (fa);
	\end{tikzpicture}
	\caption{贝塔函数与伽马函数在数学与物理中的核心枢纽地位}
	\label{fig:mathematical_unity}
\end{figure}

\subsection{源于此的物理学与统计学}
统计学与量子力学的数学形式并非凭空产生，而是深深植根于上述数学关系：
\begin{itemize}
	\item \textbf{统计学}：正态分布（源于中心极限定理）的核是高斯函数 $e^{-x^2}$，其与热核、傅里叶变换的密切联系是现代信号处理和大数据科学的基石。贝叶斯推断中的共轭先验（如贝塔分布）则直接由贝塔函数定义。
	\item \textbf{量子力学}：量子力学的数学框架核心是希尔伯特空间、算符和谱理论。
	\begin{itemize}
		\item 薛定谔方程的解常涉及特殊函数（如氢原子波函数与拉盖尔多项式，其与伽马函数相关）。
		\item 路径积分表述中，传播子 $K \sim e^{iS/\hbar}$ 的计算本质上是无穷维积分，其数学灵感源于概率论中的连续时间随机过程，并与傅里叶变换紧密相关。
		\item 量子场论中的费曼图积分常可表示为多重贝塔函数或伽马函数的组合。
	\end{itemize}
\end{itemize}

因此，17世纪始于赌桌的概率计算，其深层本质是触碰并开启了一个庞大的、内在统一的数学结构宝库。棣莫弗的正态分布和贝叶斯的定理，正是这个宝库最初闪耀出的两束光芒。统计学和量子力学并非“来源于”此数学关系，它们本身就是这些深邃数学结构在描述“不确定性”和“量子世界”时的自然显现。这表明，“计算理性化”范式的最终力量，源于数学宇宙本身的内在和谐与统一。

\section{使用欧拉-麦克劳林公式处理发散和奇点}
\begin{tcolorbox}[title=数学注记：棣莫弗-拉普拉斯定理的推导, colback=blue!5!white, colframe=blue!75!black]
	棣莫弗-拉普拉斯定理作为中心极限定理的特例，可以从更广泛的数学框架中导出。一种优美的方式是通过\textbf{欧拉-麦克劳林公式}（Euler–Maclaurin formula）。
	
	该公式建立了积分与和分之间的精确联系：
	\[
	\sum_{k=a}^{b} f(k) = \int_{a}^{b} f(x)  dx + \frac{f(a) + f(b)}{2} + \sum_{k=1}^{\lfloor m/2 \rfloor} \frac{B_{2k}}{(2k)!} \left( f^{(2k-1)}(b) - f^{(2k-1)}(a) \right) + R_m
	\]
	其中 $B_{2k}$ 是伯努利数。
	
	% ... 原有推导内容 ...
	
	\vspace{0.5em}
	\noindent\textbf{更深层的意义：正则化与解析延拓}
	欧拉-麦克劳林公式的威力远不止于近似计算。当求和项 $f(k)$ 衰减缓慢或积分 $\int f(x) dx$ 发散时，该公式提供了一种\textbf{正则化（Regularization）}发散和的方法。公式右边的积分项和伯努利数校正项共同赋予发散求和一个有限的、有物理意义的“广义和”。
	
	例如，考虑著名的发散级数 $1 + 1 + 1 + \cdots$。形式上，其生成函数为 $\sum_{k=0}^{\infty} e^{-k\epsilon} = \frac{1}{1 - e^{-\epsilon}}$。应用欧拉-麦克劳林公式（或将 $\frac{1}{1 - e^{-\epsilon}}$ 在 $\epsilon=0$ 处进行洛朗展开），会得到：
	\[
	\sum_{k=0}^{\infty} 1 \quad \stackrel{\text{正则化}}{\longrightarrow} \quad -\frac{1}{2} + \underbrace{\int_{0}^{\infty} dx}_{\text{发散}} + \sum_{k=1}^m \frac{B_{k+1}}{(k+1)!} (-\epsilon)^k + \cdots
	\]
	巧妙的是，其中发散的积分项 $\int_{0}^{\infty} dx$ 与后续伯努利数项中的奇点恰好相互抵消，最终在 $\epsilon \to 0$ 的极限下得到一个有限值（对于此例，与黎曼$\zeta$函数解析延拓的值 $\zeta(0) = -1/2$ 相联系）。这种方法在量子场论的重整化技术中有着深刻的应用，用于处理圈积分中的紫外发散。
	
	因此，棣莫弗当年所使用的数学工具，其本身也蕴含着处理“无穷大”和“奇点”的深刻思想，这为后来理论物理学的发展埋下了伏笔。
\end{tcolorbox}

\begin{tcenter}
	\begin{tikzpicture}[
		concept/.style={rectangle, draw, thick, align=center, minimum height=0.8cm, rounded corners=3pt, font=\small},
		arrow/.style={-Stealth, thick, shorten >=2pt, shorten <=2pt}
		]
		% Rows
		\node[concept, fill=red!20] (emf) at (0,0) {欧拉-麦克劳林公式};
		
		\node[concept, fill=blue!20] (clt) at (-3, -1.5) {中心极限定理};
		\node[concept, fill=blue!20] (asympt) at (0, -1.5) {渐近分析};
		\node[concept, fill=blue!20] (nums) at (3, -1.5) {数值积分};
		
		\node[concept, fill=green!20] (zeta) at (-4, -3) {解析延拓\\（$\zeta$函数）};
		\node[concept, fill=green!20] (reg) at (-1.5, -3) {发散级数\\正则化};
		\node[concept, fill=green!20] (pde) at (1.5, -3) {奇异扰动理论};
		\node[concept, fill=green!20] (qft) at (4, -3) {量子场论\\重整化};
		
		% Edges
		\draw[arrow] (emf) -- (clt);
		\draw[arrow] (emf) -- (asympt);
		\draw[arrow] (emf) -- (nums);
		
		\draw[arrow, dashed] (asympt) -- (reg);
		\draw[arrow, dashed] (asympt) -- (pde);
		\draw[arrow, dashed] (reg) -- (zeta);
		\draw[arrow, dashed] (reg) -- (qft);
		
		% Annotations
		\node[align=center, font=\footnotesize\itshape, text width=3cm] at (0, -4.2) {
			从“近似工具”到“理解奇点与无穷的哲学”
		};
	\end{tikzpicture}
\end{tcenter}
\captionof{figure}{欧拉-麦克劳林公式：从经典分析到现代理论的桥梁}
\label{fig:emf_bridge}